张茜茜等:我国公共数据开发的四大问题及原因
公共数据是数据要素的重要组成部分,具有规模体量大、数据质量高、价值潜能大、公共属性强、安全要求高、可控性强等特点。公共数据不仅要政府体系内部流转和使用,而且还要在社会上顺畅流动并被充分利用,才能释放出更大的价值红利,全面赋能经济社会发展,公共数据的开发开放是数据要素化的最有效抓手。我国现阶段公共数据开发开放还存在四大问题。
(一)存在问题
经过20多年探索实践,我国在公共数据采集汇聚、共享开放等方面已取得较大成绩,有力支撑了数字经济的发展。但是,与公共数据的庞大规模、公共数据的潜在价值、以及社会公众对公共数据共享开放的期望、以及与美欧等其他国家相比,我国公共数据共享开放还存在许多不足和问题,还有非常大的提升空间。突出表现在公共数据开发开放的水平低、范围小、质量差、数量少等方面。
1.采集汇聚的自动化水平低
政务数据共享供需对接不够充分。当前政务数据资源存在底数不清,数据目录不完整、不规范,数据来源不一等问题,亟需进一步加强政务数据目录规范化管理。数据需求不明确、共享制度不完备、供给不积极、供需不匹配、共享不充分、异议处理机制不完善、综合应用效能不高等问题较为突出。有些部门以数据安全要求高、仅供特定部门使用为由,数据供需双方自建共享渠道,需整合纳入统一的数据共享交换体系。
2.公共数据共享开放范围小
目前,我国公共数据共享开放工作主要依托电子政务建设和全国一体化政务大数据平台建设进行推动,公共数据共享范围仅限于政府各部门的政务数据,而大量掌握在公共事业单位和央国企业手中的水电汽、通信、交通、医疗、教育等民生类公共数据,以及掌握在互联网平台企业手中的个人信息等公共数据,还不在当前公共数据共享开放范围之内。
即使是政务数据的共享开放,我国大多数地区和部门都将政务数据开放划分为主动共享/开放、有条件共享/开放和不予共享/开放三种类型。可以提供给所有政府机构、公民、法人和其他组织使用的公共数据资源属于无条件共享/开放类;可以部分提供或者需要按照特定条件提供给政府机构、公民、法人和其他组织的公共数据资源属于有条件共享/开放类;涉及国家安全、商业秘密、个人隐私,以及其他不宜提供给公民、法人和其他组织的公共数据资源属于不予共享/开放类。主动共享/开放的数据不能涉及国家安全、商业秘密、个人隐私,大大减少了可供共享/开放的数据数量。尽管可以通过脱敏方式推进数据开放,但需要增加投入从而进一步降低和打击了部门积极性。因此,在各部门各地区公共数据开放的具体探索实践中,由于数源部门对公共数据共享/开放承担安全责任,但不享受相应的收益,造成公共数据共享/开放意愿不强、动力不足,基本都倾向于将数据定为有条件共享/开放类或不予共享/开放类,只有极少部分责任小的数据才会被列为主动开放类。因而,主动开放的公共数据仅局限于责任小、价值低的一小部分。
3.公共数据共享开放质量差
“有用数据的不能共享开放,而共享开放出来数据的基本没用”已成为当前公共数据共享开放的真实写照。目前,只有个别地方共享开放平台能维持较稳定的数据供给。部分平台甚至存在无法访问、网站崩溃、页面卡死等问题。而大多数地方和部门共享开放的数据质量低,甚至以虚假的、无法理解的数据填充内容;普遍存在生硬格式转化、碎片化、低容量、高缺失等质量问题;部分数据集名称表述不够清晰或文字过长、过于复杂,难以被用户理解;已经开放的数据集的持续更新比例较低;有些已经列为有条件开放的数据,但实际上并未开放;对用户所有的反馈均采用“模板式”回应等。
从2022年度全国政府数据开放评估得分来看,全国政府数据开放平均得分只有20.47分,仅浙江和山东2个省级平台以及上海、青岛、烟台、福州、深圳、济南、杭州等7个市级平台高于及格线。特别是在数据层上,无条件开放类的政府数据非常少,在数据层45分的总分中,得分最高的济南市分数仅为29.31分,只得到总分的一半多一点,得分最低的日照市分数只有22.92分,比总分少了一半以上。而有条件开放的政府数据存在大量的高缺失、碎片化、低容量的数据集,并且无法做到稳定和持续的动态更新。
4.公共数据共享开放数量少
据不完全统计,截止到2023年11月30日,全国共有21个省市共涉及1958个部门和单位在政府公共数据开放平台开放数据资源40万多个,数据总量352亿个,其中,开放公共数据目录13万个,数据集17万个,API数据接口11.1万个,与2017年全国8000多个开放数据集相比,7年增长了21倍。但是数据开放总量与欧盟和美国相比有较大差距。
(二)问题成因
公共数据的共享开放程度差和开发利用水平低主要源于数据安全制度、数据管理机制和数据开发技术等多方原因造成公共数据“不敢、不愿、不会”共享开放。其中,数据安全的严厉管理制度造成公共数据“不敢共享开放”;数据持有者缺乏动力激励,造成公共数据“不愿共享开放”;数据持有者没有专业技术能力,缺乏先进大数据和人工智能技术支撑,数据流动的效率、安全和成本难以兼顾,造成公共数据“不会共享开放”。
1.公共数据的安全底线已成为发展红线
习近平总书记多次强调要“统筹发展与安全”、”安全是发展的前提,发展是安全的保障“、“发展就是最大的安全”,“充分发挥数据资源在数字经济发展中的关键要素作用”。但是由于我国在数据层面上已出台《中华人民共和国数据安全法》、《中华人民共和国网络安全法》《中华人民共和国个人信息保护法》、《关键信息基础设施安全保护条例》(简称“三法一例”)等数据安全保障法律法规,而一直没有促进公共数据开发开放利用的相关法律,在制度规范、技术防护、运行管理三个层面尚未形成数据安全保障的有机整体。因而在实际操作过程中,往往出现“安全压倒一切”、“保障数据安全是数据全部的工作”的倾向,在相关政策制定过程中,经常出现“谁主管、谁负责,谁提供、谁负责,谁使用、谁负责”的规定;在公共数据采集汇聚过程中,经常出现“最小范围采集汇聚原则,禁止超范围采集汇聚数据”;在公共数据共享开发过程中,经常出现“根据实际应用场景申请公共数据的共享和开放”;在公共数据利用过程中,经常出现“严禁超范围使用公共数据”、“通过数据关联分析得出有关影响国家安全、个人隐私等信息时,应及时向安全主管部门报告”等,安全底线变成了发展红线。在“三法一例”的法律强约束下,公共数据采集、存储、汇聚、共享、开放、应用、治理等全生命周期各环节都可能背负数据安全的无限责任,导致公共数据提供部门、使用部门、管理部门等不同主体尽量采用“少提供或不提供、少共享或不共享、少开放或不开放、少使用或不使用”的策略,确保自身在履职过程中不必承担由于数据安全带来的法律责任。
2.公共数据统筹管理机制不健全不完善
在公共数据开发开放过程中,牵涉到更加多元化的主体更多元和更加多样化的客体,相互之间的互动关系极其复杂。但是,我国并未在政府内部、政府与其他社会主体之间形成多元参与、权责均衡的数据治理体系,未建立有效的公共数据统筹管理机制,导致各方参与数据开放共享的意愿较弱。长期以来,我国的公共数据的开发开放是以部门为中心展开的,由于数据技术、条块分割体制等限制,公共数据大都处于部门割裂和休眠状态。政务数据统筹管理机制有待完善。目前,国家层面已明确建立政务数据共享协调机制,但部分政务部门未明确政务数据统筹管理机构,未建立有效的运行管理机制。各级政务部门既受上级主管部门业务指导,又归属于本地政府管理,政务数据管理权责需进一步厘清,协调机制需进一步理顺。基层仍存在数据重复采集、多次录入和系统连通不畅等问题,影响政务数据统筹管理和高效共享。
公共数据统筹管理机制的缺陷,造成两方面后果:一方面政府在内部体系中进行跨层级、跨部门、跨地域的公共数据统筹管理的体系与能力仍然不足,导致各地各部门公共数据开放利用工作缺少联动协同,共享开放平台之间未充分实现跨层级跨地域连通,共享开放的数据在内容和标准上也存在明显差异。公共数据开放后形成的利用成果也大多局限于本地范围或单个领域,跨地域跨领域的高质量深度利用成果很少。另一方面,政府与市场、社会主体之间尚未形成有效的公共数据开放利用的协同体系与生态,严重制约了公共数据开放利用深度和广度的拓展。
3.公共数据赋能经济社会发展能力不足
目前,公共数据在经济社会发展中的乘数效应远未体现出来,关键生产要素的作用也远未发挥出来。从公共数据供给端来看,大量无条件共享开放的公共数据仅具有较高的普惠价值性和公价值性,但经济价值和商业价值都比较低。大多数经济价值较高的公共数据常常由于涉敏涉密而无法直接公开,只能通过有条件开放、隐私计算、数据沙箱、数据安全域等方式经加工后开放,但即使是经过安全处理和加工,这类公共数据仍然会设置很高的获取门槛和条件,能够获取这些数据资源的社会主体很少,并且更多面向国有企业或大型民营企业,而中小微民营企业或创新团队获取公共数据的难度很大。从公共数据需求侧来看,虽然市场和社会主体对公共数据的需求不断增加,但也由于缺少对公共数据的采集背景和政府业务逻辑的准确理解,导致即使存在较好的数据开放利用的创意思路,最终却较难落地,甚至可能出现误用数据的情况。从公共数据生态体系来看,在公共数据从开放利用到创造价值的过程中,政府、企业、从数据和应用中受益的个人或组织等都是公共数据生态体系的构建者,但目前不仅缺乏系统性的生态系统培育措施,而且对数据开放主体、数据利用主体、数据服务主体与社会公众的激励和支持不足,尤其是在数据安全的法律责任的容错免责方面没有实质性支持。
4.公共数据全链条标准规范体系不统一
除以上制度、机制、技术等方面的限制外,公共数据的相关标准体系不统一也是造成共享开放困难的重要原因。目前,各地方和部门对公共数据标准规范制定、实施、推广、应用、评估等重视不足,一些标准规范形同虚设,国家层面也未出台公共数据分级分类管理的标准规范,公共数据目录不完整、底数不清、来源不一,公共数据采集、录入、共享的权责不明晰,各地区各部门采集数据所依据的技术标准和管理规范不尽相同,往往选择“各自为政”,不仅造成在数据开发利用时,需要投入大量人力财力对数据进行清洗、比对,大幅增加运营成本,而且也无法开放共享。因此,亟需完善全国统一的政务数据标准、提升数据质量。
相关阅读
1. 张茜茜等:我国公共数据开发开放的七大特征
2. 张茜茜等:我国公共数据开发开放历经的四大发展阶段
3. 涂群等:国家数据基础设施(NDI)发展趋势
4. 涂群等:国家数据基础设施(NDI)取得成就
5. 涂群等:国家数据基础设施(NDI)的演进特点
6. 涂群等:国家数据基础设施(NDI)的演进历程
7. 涂群等:国家数据基础设施(NDI)的涵义与构成
8. 张茜茜等:我国数据要素制度体系的五大趋势
9. 张茜茜等:我国数据要素制度体系的九大特点
10. 张茜茜等:我国各地方数据要素制度体系的探索
原创内容,转载必须注明出处(“交大评论”公众号),侵权必究。